评分卡的开发
The following article is from 风控建模 Author 小溪1005
为了让更多童鞋了解申请评分卡建模过程,小编做了一个简略版的评分卡。该评分卡制作比较粗略,有部分步骤并不是严格按照严格流程来制作,仅仅为大家做一个评分卡流程梳理。
一、明确业务目标及业务定义
业务目标是确定要预测的目标,例如是预测是否欺诈还是是否逾期亦或是是否营销响应等,而每种业务目标所定义的Y也是不一样的。
一般来说定义Y是需要根据业务要求来定义好坏及表现期,像A卡可能根据巴塞尔协议来确定表现期和好坏定义,或者根据vintage与滚动率来定义。
定义完好坏及表现期后,就要进行样本选择,排除不可建模的样本。一般来说,不可建模样本包括无表现的样本,没有达到表现期的样本,强规则拒掉的黑名单客群以及定义为灰的样本等。
二、特征筛选
这里小编为了方便起见,暂时不展示如何进行特征衍生的部分了,这里直接将数据清洗为宽表,如下所示:
1.进行缺失率和单值率检查,删除缺失率在80%、单值率在90%以上的样本、以及忽略缺失值只有一个取值、分类特征水平超过50个 的特征。
2.进行EDA,计算特征每个月的缺失率、坏账率分布,以及分位数分布,删除分布不稳定的特征。
3.进行分箱,并计算每个特征的psi
4.进行细分箱,利用iv、ks等进行特征选择,这里小编用的是单调分箱
5.调用get_iv_ks_auc方法,得到特征的iv、ks、auc、missrate的值
6.调用get_all_bin_stats(),得到分箱统计表
7.计算每个特征的psi
8.进行特征筛选
三、逐步选择
1.将train_df、test_df、all_df进行woe转换,创建stepwise数据集
2.进行stepwise
3.
4.手工调整分箱
可视化分箱
计算vif及相关系数矩阵
四、模型开发
LR模型开发
五、模型验证
1.roc:
2.ks
3.lift&洛伦兹
4.模型psi
5.分数分布及密度图
6.分离度
六、转换标准评分卡
来源|风控建模
作者|小溪1005
更多精彩,戳这里: